DIALOG(R)File 35 1 :Derwent WPI 

(c) 2004 Thomson Derwent. All rts. reserv. 



01 1906764 **Image available** 
WPI AccNo: 1998-323674/199829 
XRPX Acc No: N98-253096 

Unit for performing numerical and logical operations in processors, 
multi-computer systems, data flow processors, digital signal processors - 
has bus unit enabling data to be accessed from or results to be passed to 
bus system with automatic synchronisation of several receivers to which 
data are sent bus access is decoupled from data processing 

Patent Assignee: PACT INFORM ATIONSTECHNOLOG IE GMBH (PACT-N); PACT XPP 
TECHNOLOGIES AG (PACT-N); ENTIRE INTEREST (ENTI-N); PACT GMBH (PACT-N) 
Inventor: MUNCH R; VORBACH M; MUENCH R 
Number of Countries: 081 Number of Patents: 012 
Patent Family: 

^tent,NQ r ^-Kind Date ApplicatNo Kind Date Week 
P;1^5iP Al 19980610 DE 1051075 A 19961209 199829 B 
WO 9826356 Al 19980618 WO 97DE2949 A 19971209 199830 
AU 9856514 A 19980703 AU 9856514 A 19971209 199847 
EP 943129 Al 19990922 EP 97952730 A 19971209 199943 

W0 97DE2949 A 19971209 
DE 19781412 T 19991028 DE 1081412 A 19971209 199951 

W0 97DE2949 A 19971209 
CN 1247613 A 20000315 CN 97181623 A 19971209 200031 
JP 2001505382 W 20010417 WO 97DE2949 A 19971209 200128 

JP 98524938 A 19971209 
US 6425068 Bl 20020723 US 97946810 A 19971008 200254 
US 20030056085 Al 20030320 US 97946810 A 19971008 200323 

US 2002156397 A 20020528 
EP 1310881 A2 20030514 EP 97952730 A 19971209 200333 

EP 200228401 A 19971209 
EP 943129 Bl 20030702 EP 97952730 A 19971209 200345 

W0 97DE2949 A 19971209 

EP 200228401 A 19971209 
DE 59710383 G 20030807 DE 510383 A 19971209 200359 

EP 97952730 A 19971209 

W0 97DE2949 A 19971209 

Priority Applications (No Type Date): DE 1051075 A 19961209 
Patent Details: 

Patent No Kind Lan Pg' Main IPC Filing Notes 

DE 19651075 Al 29 G06F-015/80 

WO 9826356 Al G G06F-015/78 
Designated States (National): AL AM AT AU AZ BA BB BG BR BY CA CH CN CU 
CZ DE DK EE ES FI GB GE GH GM HU ID IL IS JP KE KG KP KR KZ LC LK LR LS 
LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR 
TT UA UG US UZ VN YU ZW 

Designated States (Regional): AT BE CH DE DK EA ES FI FR GB GH GM GR IE 

IT KE LS LU MC MW NL OA PT SD SE SZ UG ZW 
AU 9856514 A G06F-015/78 Based on patent WO 9826356 
EP 943 1 29 A 1 G G06F-0 1 5/78 Based on patent WO 9826356 

Designated States (Regional): AT BE CH DE DK ES FI FR GB GR IE IT LI LU 

MC NL PT SE 

DE 19781412 T G06F-015/78 Based on patent WO 9826356 
CN 1247613 A G06F-015/78 



JP 2001505382 W 100 H03K-019/177 Based on patent WO 9826356 
US 6425068 Bl G06F-015/16 

US 20030056085 A 1 G06F-009/30 Cont of application US 979468 1 0 

Cont of patent US 6425068 
EP 1310881 A2 G G06F-015/78 Div ex application EP 97952730 
Div ex patent EP 943129 
Designated States (Regional): AT BE CH DE DK ES Fl FR GB GR IE IT LI LU 
MC NL PT SE 

EP 943 1 29 BIG G06F-0 1 5/78 Related to application EP 20022840 1 

Related to patent EP 1 3 1 088 1 

Based on patent WO 9826356 
Designated States (Regional): AT BE CH DE DK ES FI FR GB GR IE IT LI LU 
MC NL PT SE 

DE 59710383 G G06F-015/78 Based on patent EP 943129 
Based on patent WO 9826356 

Abstract (Basic): DE 19651075 A 

The unit has a programmable computer unit (EALU) for basic 
mathematical and logical functions. The functions and interconnections 
are programmed in registers, enabling processing of a number of data 
types without reprogramming. A state machine (SM-UNIT) controls the 
computer unit. Registers partially in the form of shift registers exist 
for each operand and the result. Result register data are fed back to 
an input via a multiplexer. 

A bus unit (BM-UNIT) enables data to be accessed from or results to 
be passed to a bus system with automatic synchronization of several 
receivers to which data are sent. Bus access is decoupled from data 
processing, esp. configuration and reconfiguration do not affect the 
data transmitter or receiver. Bus transfers are automatically 
controlled by a state machine (SYNC-UNIT) using handshake lines. Return 
messages allow the status of processing and reconfiguration to be 
monitored. 

ADVANTAGE - System has cascadable computer arrangement which is 
flexibly configured in terms of interconnections and functions. 
Dwg.2/16 

Title Terms: UNIT; PERFORMANCE; NUMERIC; LOGIC; OPERATE; PROCESSOR; MULTI; 

COMPUTER; SYSTEM; DATA; FLOW; PROCESSOR; DIGITAL; SIGNAL; PROCESSOR; BUS; 

UNIT; ENABLE; DATA; ACCESS; RESULT; PASS; BUS; SYSTEM; AUTOMATIC; 

SYNCHRONISATION; RECEIVE; DATA; SEND; BUS; ACCESS; DECOUPLE; DATA; 

PROCESS 
Derwent Class: Q22;T01 

International Patent Class (Main): G06F-009/30; G06F-015/16; G06F-015/78; 
G06F-015/80; H03K-019/177 

International Patent Class (Additional): B62D-025/00; G06F-009/302; 
G06F-009/38; G06F-013/38 
File Segment: EPI; EngPI 

Manual Codes (EPI/S-X): T01-F03B; T01-H01D; T01-H07A; T01-M02 



© BUNDESREPUBLIK © Offenl gungsschrift 

DE 196 51075 A1 




DEUTSCHLAIMD 




DEUTSCHES 
PATEIMTAMT 



@) Aktenzeichen: 
@ Anmeldetag: 
@ Offenlegungstag: 



196 51 075.9 
9. 12. 96 
10. 6.98 



® Int. CI. 6 : 

G 06 F 15/80 

G 06 F 9/38 
G 06 F 13/38 



o 



Ul 

Q 



@ Anmelder: 

Pact Informationstechnologie GmbH, 81545 
Munchen, DE 

® Vertreter: 

Zahn, R., Dipl.-lng., Pat.-Anw., 76229 Karlsruhe 



@ Erfinder: 

Vorbach, Martin, 76149 Karlsruhe, DE; Munch, 
Robert, 76149 Karlsruhe, DE 



in 
o 
in 

CO 

o> 

UJ 

Q 



Die folgenden Angaben sind den vom Anmelder eingereichten Unterlagen entnommen 

Prufungsantrag gem. § 44 PatG ist gestellt 

© Einheit zur Verarbeitung von numerischen und logischen Operationen, zum Einsatz in Prozessoren (CPU's), 
Mehrrechnersystemen, DatenfluBprozessoren (DFP's), digitalen Signal Prozessoren (DSP's) oder dergleichen 

@ In Verbindung mit einer konfigurierbaren und zur Lauf- 
zeit umkonfigurierbaren Einheit zur Verarbeitung von nu- 
merischen und logischen Operationen (PAE), zum Einsatz 
in Prozessoren (CPUs), Mehrrechnersystemen, Daten- 
flufcprozessoren (DFPs), Digitalen Signal Prozessoren 
(DSPs), systolischen Prozessoren und programmierbaren 
Logikbausteinen (FPGAa), gesteuert von einer Ladelogik 
(PLU), wird folgende Konfiguration vorgeschlagen: 
Es ist eine programmierbare Recheneinheit (EALU) zur 
Durchfuhrung der mathematischen und logischen Grund- 
funktionen vorgesehen, deren Funktion und Vernetzung 
in Registern programmiert wird und in denen eine Viel- 
zahl von Daten, ohne Umprogrammierung der verar- 
beitet werden kann. 

■ Zur Steuerung der Rechp"""-' e Zu- 
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Beschreibung 

1 . Hiniergrund der Erfindung 

5 1.1 Siand dcrTcchnik 

InderOfTenlegungsschriftDE44 16 881 A 1 ist ein Verfahren zur Verarbeitung von Daten beschrieben. Dabei werdcn 
in ihrer Funktion und Verneizung weiigehend frei konfigurierbare, homogen angeordnete Zellen verwendet. 

Unabhangig von der erwahnten Offenlegungsschrift werden zunehmend FPGA-Bausteine (frei programmierbare Lo- 
10 gikbausleine) verwendei, uin Rechenwerke und Daten verarbeilungseinrichlungen aus einer Vielzahl einzelner Logikzel- 
len aufzubauen. 

Kin wcilcres bckanntcs Vcrfahrcn ist der Aufbau von Datcnverarbcitungscinrichtungcn aus fasten, programmgestcu- 
erten Rechenwerken mil weiigehend fester Vemetzung, sogenanmen sysiolischen Prozessoren. 

15 1.2Probleme 

1.2.1 Bausteine nach DE 44 16 881 Al 

Bausteine nach dem in DE 44 16 881 A I beschriebenen Verfahren (im folgenden VPUs genannt) sind aufgrund der 
20 hohen Zahl klciner Logikzcllcn schr aufwendig zu konfiguricrcn. Zur Stcucrung cincr Logikzclle sind nichrerc Stcucr- 
Bit in einem staLischen Speicher (SRAM) anzugeben. Fur jede Logikzelle existiert eine SRAM-Adressa Die Zahl der zu 
konfigurierenden SRAM-Zellen ist sehr hoch, was zu einem erheblichen Plalzbedarf und Zeitaufwand fiir die Konfigu- 
ration und Umkon figuration eines solchen Bausteines fuhrt. Der hohe Plalzbedarf ist besonders unangenehm, da die Ver- 
arbeitungsleistung einer VPU mit steigender Zahl der Zellen zunimmt. Jedoch ist die verwendbare Flache eines Baustei- 
25 nes durch die Chipferligungstechnologien begrenzl. Der Preis eines Chips steigt etwa quadratisch zur Chipfiache. Auf- 
grund der mehrfach abgebildeien Next-Neighbour Vernetzungsstruktur ist ein Broadcast, also das Senden von Daten an 
mehrere Empfanger gleichzeitig, unnioglich. Solltcn VPUs im Bctricb umkon figurierl werden, ist es zwingend crfordcr- 
lich kurze Umkonfigurationszeiten zu erreichen. Dagegen steht jedoch die groBe Anzahl an Konfigurationsdaten die be- 
notigt werden, um den Chip umzukonfigurieren. Es existiert keine Moglichkeit Zellen von der Versorgungsspannung zu 
30 Irennen oder langsamerzu takten, uin die Verluslleistung zu minimieren. 

1.2.2 FPGAs 

Fur den beschriebenen Einsatzbereich interessante FPGAs bestehen zumeist aus Multiplexer oder Look-Up- Table 
35 (LUT) Stnikturen. Zur Implementiemng werden SRAM- Zellen eingesetzt. Aufgrund der Vielzahl an kleinen SRAM- 
Zellen sind sie sehr aufwendig zu konfigurieren. Es sind groBe Datenmengen erforderlich, die einen entsprechend groBen 
Zeitaufwand zum Konfigurieren und Umkonfiguricren erfordem. SRAM-2^ellcn benoligen sehr viel Plalz. Jedoch ist die 
verwendbare Flache eines Bausteines durch die Chipferligungstechnologien begrenzt. Der Preis steigt auch hier etwa- 
quadratisch zur Chipfiache. SRAM basicrende Technologic ist durch die Zugriffszcit auf den SRAM langsamcr als direkt 
40 integrierte Logik. Obwohl viele FPGAs auf Busstmkturen aufbauen, sind keinerlei Broadcast-Moglichkeiten zum 
schnellen und effektiven Senden von Daten an mehrere Empfanger gleichzeitig gegeben. Sollen FPGAs im Belrieb um- 
kon figuricrt werden, ist es zwingend erforderlich kurze Konfigurationszeiten zu erreichen. Dagegen steht jedoch die 
groBe Anzahl an Konfigurationsdaten die benotigt werden. FPGAs bieten keinerlei Unterstutzung rur eine sinn voile Um- 
konfigurierung im Belrieb. Der Programmierer hat dafur zu sorgen, daB der Vorgang ordentlich ohne storende Einflusse 
45 auf Daten und umgebende Logik ablauft. Eine intelligente Logik zum Minimieren der Verlustleistung ist nicht vorhan- 
den. Es bestehen keine speziellen Funktionseinheiten, die eine Riickmeldung der internen Betriebszustande an die das 
FPGA steuernde Logik enndglichen. 

1 .2.3 Systolische Prozessoren 

50 

Bei systolischen Prozessoren entfallt die Umkonfigurierung komplett, jedoch sind diese Prozessoren unflexibel, da sie 
einen starren internen Aufbau besitzen. Befehle werden in jedein Zyklus neu dekodiert. Wie bereits in der beiden vorhe- 
rigen Abschnitten beschrieben fehlen Funktionen, die ein Broadcasting oder die effiziente Minimierung der Verlustlei- 
stung beinhaltcn. 

55 

1.3 Verbesscrung durch die Erfindung, Aufgabe 

Die Erfindung umfaBt ein kaskadierbares Rechenwerk, das flexibel in seiner Funktion und Vemetzung konfigurierbar 
ist. Es benotigt wahrend der Ausfuhrung des Algorithinus keine Befehlsdekodierung. Es ist im Belrieb umkonfigurierbar, 

60 ohne EinfluB auf die umgebenden Rechenwerke, Verarbei lungs module und Datenstrome zu haben. Die Menge der Kon- 
figurationsdaten ist sehr klein, was sich giinstig auf Plalzbedarf und Konfigurationsgeschwindigkcit auswirkt. Um groBe 
Datenmengen schnell und effizient zu verteilen wird Broadcasting iiber die internen Bussysteme unterstiitzt. Das Re- 
chenwerk ist mit einer Stromsparfunktion ausgestattet, wodurch die Stromaufnahme komplett ausgeschaltet wird, ebenso 
existiert ein Taktteiler, der es ennoglicht das Rechenwerk mit einem gcringcren Takt zu betrieben. Fiir Ruckmeldungcn 

65 der internen Zustande an die externen Steuerungen stehen besondere Mechanismen zur Verfugung. 
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2. Beschreibung der Erfindung 

2. 1 Ubersichl iiber die Erfindung, Abstrakl 

Die Erfindung beschrcibt den Aufbau cincr Zclle im Sinnc von DE44 16 881 A1 odcr bekannter FPGA Zellen. In 5 
diese Zelle integricrt ist cine um Sonderfunktionen erweiterte Arithmetisch-Logische-Einheit (EALU), die die Datenver- 
arbeiiung durchfuhrt. Die EALU wird iiber ein Funktionsregisterregister konfiguriert, dadurch sinkt die fur die Konfigu- 
ration erforderliche Daten menge erheblich. Die Zelle ist iiber ein Bussystem frei kaskadierbar, dabei ist die EALU vom 
Bussysteni iiber Ein- und Ausgaberegister entkoppelt. Die Ausgaberegister sind auf einen Eingang der EALU zuriickge- 
fiihrt um serielle Operationen zu ennoglichen. Die Aufschallung auf den Bus iiberninum eine Bussteuereinheii, die den 10 
Bus entsprechend dem Busregisier vernetzi. Dabei ist die Einheit so konzipiert, daB das Verteilen von Daten an mehrere 
Kmpfangcr (Broadcasting) moglich ist. Hinc Synchronisationsschaltung steucrt den Datcnaustausch z.wischcn mehrercn 
Zellen iiber das Bussystem. Die EALU, die Synchronisaiionsschalmng, die Bussteuereinheii und die Register sind so ge- 
sialteu daB eine Zelle unabhangig von ihren Umgebungszellen im Betrieb umkonflguriert werden kann. Uber das Funk- 
lionsregisler kann ein Slromsparmodus konfiguriert werden, der die Zelle abschallel, ebenfalls konncn Taklteiler eingc- 15 
slellt werden. die die Arbeitsfrequenz verringern. 

2.2 Delailbeschreibung der Erfindung 

Die Erfindung beschrcibt den Aufbau cincr Zcllc (PAE=Proccssing Array Element) im Sinne von DE44 16 881 A 1 20 
oder bekannter FPGA Zellen, dabei sind die PAEs zu einem Array (Processing Array = PA) kaskadierbar. Eine PAE ist 
aus einer Vielzahl von Funktionseinheiten aufgebaut: 

2.2.1 EALU 

25 

Das Rechenwerk besteht aus einer fest in Logik implementierlen erweiterten Arithmetisch-Logischen-Einheit EALU. 
Eine EALU ist cine gcwohnliche Arithmctisch-lx)gischc-Einhcii nach dem Stand der Tech nik (ALU), die durch spezicllc 
Funktionen, wie Zahler erweitert ist. Diese EALU ist in der Lage eine Vielzahl von arithmetischen und logischen Ope- 
rationen durchzufuhren, ohne hier genau spezifiziert werden zu miissen, da auf ALUs die dem Stand der Technik entspre- 
chen zuriickgegrifTen werden kann. Die EALU hat direklen ZugriiT auf ihre eigenen Ergebnisse, diese werden wir nach- 30 
folgend beschrieben als Operand zuruckgefiihrt. Dadurch sind Zahler oder serielle Operationen, wie die serielle Multi- 
plikation, Division odcr Rcihcncntwicklungcn, moglich. Die EALU licfert neben ihrem Ergcbnis die Signale CarryOut- 
AlessB und AequalB-Odetect. CarryOut-AlessB gibt entweder bei arithmetischen Operationen das Carry an, oder bei 
Vergleichen mittels einer Subtraktion zweier Werte gibt der IJberirag, also ('arryOut-AlessB, daB A < B, bzw. B < A, ab- 
hangig vom negierten Operanden an. Das Signal ist das ubliche Carry generiert durch einen \blladdierer. AequalB-Ode- 35 
tect gibt an, daB das Ergebnis im Ergebnisregister R-REGsft gleich 0 ist. Das Signal wird iiber ein NOR aus dem Ergeb- 
nis generiert. Die Signale werden zur einfachen Auswertung von Zuslandcn verwendet und konnen an die PLU zuriick- 
geliefert werden. Weitere Statussignale sind je nach Anwendung implementierbar. 

Die Funktion der EALU wird in cincm Funktionsrcgistcr (F-PLURFG) konfiguriert. 

40 

2.2.2 0-RE(3 

Die Eingangsoperanden der EALU werden in zwei unabhangige Operandenregister (O-REG) gespei chert. Dadurch 
stehen sie unabhangig des Zustandes der Hinheit, die die Daten liefert (Datensender) zur Verfugung. Dies ist notwendig 
um eine Entkopplung vom Bus und eine freie Umkonfigurierbarkeit des PAs zu ermoglichen. Eines oder beide O-REG 45 
besitzen eine Schiebefunktion, die von der EALU fur ggf. jedes O-REG einzeln angesteuert wird. Die Schiebefunktion 
ermoglicht das Durchfuhren von seriellen Operationen wie serielles Ivlultiplizieren oder Dividieren im EALU. O-REG 
mit Scheibefunktion werden als O-REGsft bezeichnet. 

2.2.3 R-REGsft 50 

Das Ergebnis der EALU wird in einem Ergebnisregister gespeichert (R-REGsft). Dadurch wird die zeilliche Unabhan- 
gigkeit von der oder den das Ergebnis empfangenden Einheiten (Datenempfanger) erreicht. Das R-REGsft besitzt eine 
Scheibefunktion, die von der EALU angesteuert wird, wodurch serielle Operationen ermoglicht. werden. 

55 

2.2.4 R20-MUX 

Die Ergebnisdaten, die in R-REGsft stehen, werden iiber einen Multiplexer (R20MUX) zwischen einem der O-REG 
und der EALU als Operand eingeschleift, um eine Ruckkopplung des Ergebnisses fur serielle Operationen,' Zahler und 
ahnliche Funktionen zu gewahrleisten, Der Multiplexer wird durch das F-PLUREG eingestellt. 60 

2.2.5 Taktzyklen 

Es isl sinnvoll, jedoch nicht zwingend erforderlich, die O-REG(sft) bei einer Taklflanke anzusteuem und die R-REGsft 
bei der darauffolgend negierten Taklflanke. Dadurch hat die EALU einen Halbtakt zur Ausfuhrung ihrer Funktion zur 65 
Verfugung, der zweite Halbtakt steht Fur Signallaufzeiten und Multiplexer zur Verfugung. Dadurch wird es moglich in je- 
dern Takt eine komplette Operation auszufuhren. 
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2.2.6 SiateMachine, SM-Unit 

Zur Ablaufsleuerung in der EALU existiert eine SM-UNIT. Diese steuen die O-REG unci R-REGsfl und deren Schie- 
befunktion, sowie R20-MUX. Dadurch wird erreicht, dafl scrielle Operaiioncn, Schiebe- und Zahlfunktionen einfach 
5 von dcr EALU durchgcfuhrt wcrdcn konnen. Die StatcMachinc isl dabci nach dem Stand dcr Tcchnik einfach zu implc- 
mentieren. 

2.2.7 Sync-UNTT 

10 Zur Synchronisation einer PAE innerhalb eines Arrays (PA) aus PAEs ist eine Synchronisaiionseinheit (Sync-UNTT) 
vorhanden. Diese wertet eine Reihe von Eingangssignalen, die ein HandshakeProiokoll ausfuhren, aus. 

rACK(M): Der Dalenempfanger quittiert die empfangenen Daten. Dabei isl rACKh die Quittierung des hohen Ergebnis- 
bytes (Bit 8 bis 15) und rACKl die des niederen Ergebnisbytes (Bit 0 bis 7). Beide werden verUNDet (rACKh UND 
15 rACKl) und ergeben das Signal rACK. rACK ist nichl wahr, wahrend einer oder beide Dalenempfanger mil der Verar- 
beitung ihrer Daten beschaftigt sind und wird wahr wenn die Verarbeitung der Daten beider Datenempfanger abgeschlos- 
sen ist und das Hrgebnis im R-REGsti des jeweiligen Datenempfangers gespeicherl ist. Die Signale rACK(h/l) werden im 
weiteren oflmals in ihrer verUNDeten Form als rACK (= rACKh & rACKl) beLrachlel. 

oRDY(l/2): Der Datensender signahsiert seine Bereitschaft neue Daten zu senden. oRDY isl nicht wahr, wahrend der 
20 Datensender mil dcr Verarbeitung seiner Daten beschaftigt ist und wird wahr, wenn das Ergebnis des Datensenders, das 
der Operand der PAE isl, zur Verfugung steht. Dabei ist oRDYl das Freigabesignal des Datensenders des ersten Operan- 
den und oRDY2 das des Zweiten. Beide werden verUNDet (oRDYl UND oRDY2) und ergeben das Signal oRDY. 
oRDY ist nur wahr, wenn beide Datensender bereit sind Daten zu versenden. Die Signale oRDY(l/2) werden im weite- 
ren oftmals in ihrer verUNDeten Form als oRDY (=oRDYl & oRDY2) betrachtet. 

25 

Aus den Eingangssignalen und dem Zustand der Sync-UNTT, der zusammen mil der Ablaufsteuerung der EALU den Ge- 
samtzusland dcr PAE darstellt, werden Ausgangssignale gencriert, die von den Sync-UNTTs der Datensender und -emp- 
fanger ihrerseits als Eingangssignale beirachtet werden. Zur Ablaufsleuerung der EALU werden deren Statusinformatio- 
nen und das Register F-PLUREG verwendet. 

30 

rRDY: Zeigt an, daB die PAE ihre Daten verarbeitung beendet hat und ein Ergebnis im R-REGsft zur Verfugung steht. 
rRDY wird als rRDYh und rRDYl an beide Datenempfanger ubcrtragen. Dabci handell cs sich jedoch urn dasselbc Si- 
gnal! 

oACK: Zeigt an, daB die PAE ihre Operanden verarbeitet hat und neue Daten in den O-REG(sft) aufnehmen kann. oACK 
35 wird als oACKl und oACK2 an beide Datensender ubertragen. Dabei handelt es sich jedoch um dasselbe Signal! 

Die RDY- Sign ale behalten ihren Pegel bis zum Eingang der Quittierung durch ACK bei. Dies isterforderlich wenn der 
Dalenempfanger wahrend der Bereilslellung der Daten umkonfiguriert wird. Steht RDY bis zur Quitiierung durch ACK 
an, so erkennt der Datenempfanger nach der Umkonfigurierung, daB Daten bereitstehen und nimmi sie an. 

Die Vcrkniipfung dcr Signale iibcr nichrcrc PAEs stellt sich wie folgt dar: 

40 

Datensender PAE Datenempfanger 

rRDY — ► oRDYrRDY — + oRDY 
rACK <— oACKrACK <— oACK 

45 Das bedeutet z. B. das Ausgangssignal rRDY des Datensenders stellt das Eingangssignal oRDYl oder oRDY2 der 
PAE dar. Das Ausgangssignal rRDY der PAE stellt das Eingangssignal oRD Y des Datenempfangers dar. 
Die Sync UNIT besitzt folgende Ablaufarten: 





Modus 


Beschreibung 


Bemerkung 


50 


Warten OP 


Die PAE wartet auf Operanden 


Nur wenn keine mehrzykli- 
sche Operation ablauft 




Zyklus 1 


Eine einzyklische Operation 
wird durchgefiihrt 


Operanden werden quittiert 


55 


Zyklus n 


Ein Zyklus einer mehrzyklischen 
Operation wird durchgefuhrt 






Zyklus Z 


Der letzte Zyklus einer 
mehrzyklischen Operation ■ 


Operanden werden quittiert 


60 




wird durchgefiihrt 




Warten ERG 


Die PAE wartet auf die 
Quittierung des Ergebnisses 


Nur wenn vorhergehendes 
Ergebnis exisistiert 




Stop 


Ausfuhrung nach Beendigung des 






laufenden Zyklusses anhalten, 
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. dann ReConfig quittieren, wenn 
auch Ergebnis quittert wurde 





Die Sync-UNIT stellt einen besonderen Modus zur Verfugung, der das Taktsignal nur freigibt, wenn Operanden zur 
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Verfiigung stchen. Dieser Modus isl vor allem dann sinnvoll. wenn die Daiensender die Daten nicht in jedem Prozessor- 
takt liefern, sondem nur jeden n. Takt. Dabei emspricht der Takt einer Periode des Normaliaktes und wird iiber rACK 
oder oRDY(l/2) freigegeben. Die Freigabe wird als OneShol bezekhnel. Der Modus wird als OneShol-MODE bezeieh- 
net. Dabei wird der Takt iiber ein UND-Gatter mil einern der Freigabesignale verlJNDet. Der Modus und die Signalaus- 
wahl findet iiber das F-PLUREG stall. Das Frcigahesignal, genericrt iiber rACK oder oRDY(1/2), kann von der SM- 5 
UNIT verlangert werden. Dies ist erforderlich, damil Operationen, die mehr als einen Takt benotigen im OneShot- 
MODH durchgefuhrt werden konnen. Um dies zu ermoglichen, wird eine entsprechende Signalleitung der SM-UNIT mit 
dem Freigabesignal verODERt. 

Wird der Registered trag STOP im F-PLUREG geselzt, so fiihrl die Sync-UNIT die laufende Funktion zu Ende. Da- 
nach werden keine weileren Operanden mehr angenommen und quitliert. Sobald rACK anzeigl, daB das Ergebnis vom 10 
Datenempfanger angenommen wurde, wird die Umkonfigurierungsbereitschaft der PLU durch das Signal ReConfig an- 
gczeigt. Das Signal wird gencriert, indem rACK das Stop des F-PLUREG in cin D-KlipFlop spcichcrt. ReConfig kann 
durch einen lesenden Zugriff der PLU auf F-PLUREG an der Bilposition von Slop abgefragt werden. 

Ebenfalls kann die Sync-UNIT dazu verwendet werden Fehlerzustande oder weitere Stalussignale zu generieren und 
auszuwertcn. 15 

2.2.8 BM-UNIT 

Zum Aufschalten der Operanden und des Ergebnisses auf die externen Bussysteme existiert eine Busmultiplexeinheit 
(BM-UNIT). Dicsc bcstehi aus 2 Muliiplexern und 2 Tore, wobci die 2 Multiplexer fur die Operanden (O-MUX) und 2 20 
Tore fur das Ergebnis (R-GATE) existieren, dabei wird jeweils ein Schalier fur das hoherwertige und niederwertige Er- 
gebnis verwendet. Die Multiplexer und Schalter werden iiber das Multiplexerregister (M-PLUREG) gesteuert. Die Sync- 
UNIT-Signale werden iiber die Schalter auf den Bus gesteuert. Dabei ist die Zusammengehorigkeit der Multiplexer/ 
Schalter und Signale wie folgt: 

25 

0-MUXl:oRDYl,oACK 
0-MUX2: oRDY2, oACK 
RII-GATE: rRDY, rACKh 
RL-GAfE: rRDY, rACKL 

30 

Das R-GATE kann iiber das M-PLUREG in einen Zustand gebrachi werden, in dem es kein Bussystem ireibt. 
Die Tabellc gibt cine Beschrcibung der Signale, sowic dercn jcwciligcr Interfacc-Struktur: 



Signal 


oRDY 


oACK 


rRDY 


rACK 


D7..0 


zeigt an 


Operanden 
bereit 


Operanden 
quittiert 


Ergebnis 
bereit 


Ergebnis 
quittiert 


Daten 


Typ 


Eingang 


Open-Kollektor 


Treiber 


Eingang 


Bidirektional 



Es ist moglich mehrere Datenempfanger von einem Datensender aus anzusprechen (Broadcasting). Hierzu schalten 40 
sich mehrere Datenempfanger auf denselben Bus. Um eine Quittierung der Daten zu gewahrleisten ist die Treiberstufe 
der Quittierungsleitung oACK als OfTencr-KoUeklor-Treiber gestaltet. Dabei arbcitel der Bus als wired-AND, d. h. erst 
wenn alle Datenempfanger quittieren entsteht der fur die Quittierung erforderliche H-Pegel. Dies wird dadurch erreicht, 
dati jeder Datenempfanger, der NICHT quittiert den Bus iiber einen Open-Kollektor- Transistor auf einen L-Pegel zieht. 
Datenempfanger die quittieren, steuem den Open-Kollektor- Transistor nicht an und belasten somit den Bus nicht. Wenn 45 
alle Datenempfanger quittieren wird der Bus nicht mehr belastet und nimmt iiber einen Pull-Up-Widerstand H-Pegel an. 

2.2.9 StateBack-UNIT 

Die PAE ist in der Lage Riickmeldungen iiber ihren Betriebszustand an ihre Ladelogik, im folgenden PLU genannt, zu 50 
liefern (vgl. DE44 16 881 Al). Die Ladelogik konfiguriert das PA und benoligt, um sinnvolle Umkonfigurationen vor- 
nehinen zu konnen, Infonnationen iiber den Status der einzelnen PAEs. Dies geschieht iiber die SiateBack-UNIT. Diese 
ubertragt je nach Eintrag im F-PLUREG entweder die unteren 3-Bit des Ergebnisses aus dem R-REGsft - um berechnete 
Werte an die PLU zu liefern -oder die Signale Carry Out- AlessB und AcqualB-Odctcct auf einen 3-Bit Stat usbus. Um das 
Aufschalten der Signale von mehreren PAEs aus zu ermoglichen wird ein einfaches wired-OR Verfahren iiber Open-Kol- 55 
lektor-Treibern verwendet. Damit die Umkonfigurierung der PAE erst beginnt, wenn der Empfanger die Daten quittiert 
hat, kann zwischen den Signalen und den Open-Kollektor-Treibern eine Latch-Stufe eingeschleift werden, die die Si- 
gnale erst nach Eingang des rACK freigibt. Der Statusbus wird von der PLU iiberwacht. Diese reagierl in ihrem Pro- 
grammfluB und ihrer Umkonfiguration auf den vom Bus gelieferten Status. 

60 

2.2.10 Powcr-UNTT 

Die PAE besitzt einen Stromsparrnodus (Sleep-MODE), der ebenso wie die Funktion der EALU im F-PLUREG ein- 
gestellt wird. Hierfur existiert ein Bit, das, wenn es gesctzt isl, den Sleep-MODE einschaltct. Hierzu kann entweder die 
Taktleitung der PAE auf konstant logisch 0 oder 1 gesetzt werden, oder iiber einen Transistor die Spannung der PAE ab- 65 
geschaltet werden. Das F-PLUREG stent innerhalb der PAE immer unter Spannung und ist nicht abschaltbar. Fiir die je- 
weils ausgefiihrte Funktion unbenulzte Bereiche (Gatter) der PAE werden durch Auswertung des F-PLUREG abgeschal- 
tet. Dies geschieht iiber einen Transistor, der die Bereiche von der Spannungsversorgung trennt. Um unerwiinschte Stor- 
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einfliisse zu verhindem sind die Ausgange der Bereiche iiber PuLI-Up/Pull-Down-Widersiande definiert. 

Zusatzlich kann innerhalb des OneShot-MODE, der von der Sync-UNl T gesieuert wird, der PowerSave-MODE ver- 
wendet werden. Dabei werden sarnlliche Teile der PAE, mil Ausnahme von F-, M-PLUREG und Sync-UNTT von der 
Versorgungsspannung gelrennt. Erst wenn die Sync- UNIT einen OneShot feststellt. werden alle benotigten PAE-Teile 
5 ubcr die Powcr-UNTT zugcschaltet. Die Sync-UNTT vcrzogert das Takisignal so lange, bis alle neu zugcschalieten Tcilc 
arbeitsfahig sind. 

2.2.11 Register 

10 Die Register F-PLUREG und M-PLUREG sind mil dem PLU-Bus verbunden. Die Adresse der von der PLU gesende- 
ten Datenpakete werden in einem Vergleicher dekodiert. 1st die Adresse der PAE erkannt, so werden die Daten in die Re- 
gister gcspcichcrt. Der PLU-Bus ist wic folgt gcstaltct: 

AX 7 ... 0: X- Adresse der X/Y-Matrix 
15 AY7 ... 0: Y-Adressc der X/Y-Matrix 

RS: Register Select, logisch 0 wahlt F-PLUREG, logisch 1 wahlt M-PLUREG aus. 

AHN: Adress Enable, der Bus enthalt. eine gultige Adresse. Die Adressen miissen dekodiert werden, solange AHN lo- 
gisch 0 ist. AEN ist wahrend des gesamten Buszugrifles, also auch wahrend der Datenubertragung logisch 0. 
D23 . . . 00: Daten 

20 DEN: Data Enable, der Bus enthalt gultige Daten. Die Daten miissen bci steigender Flanke des Signals DEN in das Re- 
gister ubertragen werden 

OHN: Output Enable, die PLU liest gultige Daten aus den PLURHGs. 

Der Aufbau des F-PLUREG 

25 

1 . Der Registeraufbau beim SchreibzugrifT 



[Fll 


F10..9 


F8 


I F7..6 


F5 


F4..0 J 


| Stop 


StateBack 


Sleep 


j OneShot 


PowerSave 


EALU function | 



Die Funktionen der einzelnen Bit 

35 



| FYinktion | Zustand | Wirkung 



Stop 


0 


Norm ale Funktion 




1 


Funktionen nach laufendem Zyklus anhalten, 






keine Quittierung der Operanden 


StateBack 


00 


kerne Ruckmeldung, Bus ofFen 




01 


D2..0 auf Bus 




10 


CarryOut-AlessB, AequalB-Odetect auf Bus 




11 


illegal 


Sleep 


0 


keine Funktion, spannungslos 




1 . 


normale Funktion, Spannung 


OneShot 


00 


normale Funktion 




01 


OneShot auf oRDYl 




10 


OneShot auf oRDY2 




11 


OneShot auf (rACKh & rACKl) 


'PowerSave 


0 


kein PowerSave 




1 


Stromsparmodus in Verbindung mit OneShot 


EALU function 


00000 


keine Operation (NOP) 




00001 








Funktion gemafi Ausfuhning der EALU 




11111 





Der Rcset-Zustand ist 0 in alien Bits. 



65 
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2. Der Registeraufbau beim LesezugriiT 



| Fll 
ReConfig 



Die Funktionen der einzelnen Bits 



10 



Punktion 


Zustand 


Wirkung 


ReConfig 


0 
1 


Keine Umkonfiguriening moglich 
Umkonfigurierung moglich 



15 



Der Resel.-Zust.and ist 0 in alien Bits. 



Der Aufbau des M-PLUREG 



20 



| M23..18 


M17..12 


Mil. .06 M05..00 | 


| Ergebnis hoherwertig 


Ergebnis niederwertig 


Operand 1 | Operand 0 | 



Die Werte M(n+5) . . . n = 000000, n e {0, 6, 12, 18} bedeuten, daB die Multiplexer/Schalter offen sind und keinen 
Buskontakt besit7.cn. Es kann sinnvoll sein, das M-PLUREG iiber das Signal ReConfig zu spcrrcn, d. h. sobald ReConfig 
aktiviert wird, schaltet sich die PAE von alien Bussystenien ab. Der Reset-Zustand ist 0 in alien Bits. 



25 



2.3 Zusaimnenfassung 30 

Durch die Reduzicrung der Konfigurationsdatcn auf das Register F-PLUREG kann die Funktion des PAE cinfachcr 
und schneller konfiguriert und umkonfiguriert werden. als in bekannten Technologies ins besondere der FPC A-Techno- 
logie. Die Vemetzung des Rechenwerkes wird im M-PLUREG angegeben, wahrend in den herkommlichen Technolo- 
gien eine Vielzahl einzelner, nicht zusammenhangender Konfigurationsbits besetzt werden mussen. Durch die klare 35 
Struktur der Register wird eine (Um)Konfiguration vereinfacht. 

Der Plalzbedarf des PAE ist durch die dirckle Ausgeslallung als Rcchenwcrk kleiner als in herkdmmliehen Technolo- 
gien, in denen Rechenwerke durch eine Vielzahl von Logikzellen implementiert wurden. Gleichzeitig sind die Durch- 
laufvcrzogcrungcn gcringen und die crziclbarcn Taktfrcquenzcn cntsprcchcnd hohcr. 

Eine Broadcasting-Funktion ist durch die Ausgestaltung der BM-UNIT gewahrleistet, die Quittierung erfolgt automa- 40 
tisch. Durch die ein- und ausgangsseitigen Register (O-REG, R-REG) ist ein zeitlich weitgehend unabhangiger Daten- 
transfer gewahrleistet. 

Die Konfiguration und Umkonriguration wird durch die Entkopplung jeder PAE vom Gesamtsyslem uber die Register 
O-REG und R-REG erheblich vereinfacht, da die einzelnen PAEs weitgehend voneinander unabhangig sind. Die Riick- 
meldungen an die PLU, sowie das Zusammenspiel von STOP und ReConfig ermoglichen die effiziente Steuerung der 45 
(Um)Konfigurationen. 

Es sind Stromsparfunklionen implementiert, die - teilweise automatisch (OneS hot -MODE) - zu einer Reduzierung 
des Leistungsverbrauches fuhren. 

Die PAE-Struktur kann zur Erhohung der Effizicnz von FPGAs in dcren Architcktur implementiert werden. Dadurch 
sind arithmetische Operationen erheblich leistungsfahiger realisierbar. 50 



3. Kurzbeschreibung der Diagramme 

Fig. 1 Anordnung mehrcrer PAEs zu cincm PA mil PLU. Ohne Verbindung zu Ein-/Ausgabesystcmen odcr Spcicher. 
Fig. 2 Aufbau einer PAE. 55 
Fig. 3 Aufbau von F-PLUREG und M-PLUREG. 
Fig. 4 Aufbau eines O-REG. 

Fig. 5 Aufbau eines O-REGsft mit rechtsschiebe-Funktion. 

Fig. 6 Aufbau eines R-REGsft mit rechts/links l-2bit Barrel-Shifter. 

Fig. 7 Aufbau des R20-MUX, sowie Implemenuerung eines MUX in Transfer-Gate-Technik. 60 
Fig. 8 Taktsynchronisation, Vcrzogcrungcn und synchron Sign ale 
Fig. 9 Funktionsweise der Sync-UNIT. Beschreibung. 
Fig. 10 Aufbau der Power-UNIT 
Fig. 11 Aufbau der Sync-UNIT 

Fig. 12 Aufbau der BM-UNIT 65 
Fig. 13 Aufbau eines O-MUX, begrenzt auf 4 Bussysteme 
Fig. 14 Aufbau eines R-GATE, begrenzt auf 4 Bussysteme 
Fig. 15 Aufbau der StateBack-UNTT 
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Fig. 16 Funkiionsprinzip des OneShoi- und OneShoi/PowerSave-MODE. 

4. Delailbeschreibung der Diagraiiime 

5 Fig. 1 siclll. cincn vcrcinfachlcn Prozcssor gcmaB DE 44 16 881 Al dar. Zudcm ist die PLU (0101) und dcrcn Bussy- 
stem (0102) angezeigt. Die PAEs (0103) sind als Array eingelragen, das chipinteme Bussyslem (0104) isl schemaiisch 
dargesiellt. 

Fig. 2 zeigt den schematisierten Aufbau einer PAE. Das chipinierne Bussystem (0201) wird an die BM-UNTT (0202) 
gefuhrt, welche die durch M-REG (0203) ausgewahllen Busse an das O-REG Isft (0204) als Operand 1 und das O-REG 

10 (0205) als Operand 2 weitersehallet. In den Dalenpfad von Operand 2 wird uber den R20-MUX (0206) das im Ergeb- 
nisregister R-RECsft (0207) stehende Ergebnis wahlweise eingeschleift. Die Daten aus O-REGsft (0204) und R20- 
MUX (0206) werden im ELAU (0208) verarbeitet. Ubcr die StatcBack-UNIT (0209) finden Ruckmcldungcn an die PLU 
statt. Der PLU-Bus (0210) hat Verbindung zu den Registem F-PLUREG (021 1) und M-PLUREG (0212), sowie der Sla- 
teBack-UNIT (0209). Uber ihn wird die PAE konfiguriert und uberwacht. Das F-PLUREG enthalt alle funktionellen 

15 Konfigurationsdalen, das M-PLUREG enlhall die Vernclzungsinfonnalion der PAE. Die Sync-UNIT (0212), sleuerl das 
Zusammenspiel des Datenausiausches zwischen den Dalensendem, den Datenempfangem und der Verarbeitungs-PAE. 
Die SM-UNIT (0213) sleuert den gesamren internen Ablauf der PAE. Die Power-UNIT (0214) regelt die Stromversor- 
gung und dient der Reduzierung des Slromverbrauches. 

In Fig. 3 wird die Funkiionsweise der Register M-PLUREG und F-PLUREG verdeutlicht. Die Adressen AX und AY 

20 des PLU-Bus (0308) werden in eincm Vcrglcichcr (0301) mil der Adrcssc der PAE verglichcn, sofern AEN (Adrcss En- 
able) einen gultigen Busiransfer anzeigt. Dabei besitzt jede PAE eine eindeutige Adresse, die sich aus ihrer Spalte und 
Teile innerhalb einer PA zusammensetzl. Zeigt DEN (DataHnable) die Datenubertragung an, so wird uber RS (Register- 
Select) entweder M-PLUREG (0302) oder F-PLUREG (0303) ausgewahlt. Bei der steigenden Flanke von DEN werden 
die Daten im betreffenden Register gespeichert. Die Register sind als D-FlipFlop (0304) implementiert. Zur Verdeutli- 

25 chung des Ablaufes dienl das Tnningdiagramm 0305. Zuin lesenden ZugritTauf das F-PLUREG wird lediglich uber das 
Tor (0306) das Signal ReConfig von der Sync-UNIT an den PLU-Bus gegeben. Die Freigabe geschieht iiber das Ergebnis 
des Vcrglcichcrs (0301) UND dem Signal OEN. 

Fig. 4a zeigt das Blockdiagramm des O-REG. In Fig. 4b ist der Aufbau des O-REG aus D-FlipFlops ersichtlich. Das 
Timingdiagramm ist in Fig. 4c dargestellt. Der Takt wird von der SYNC-SM generiert. 

30 Fig. 5a zeigt das Blockdiagramm des O-REGsft. In Fig. 5b ist der Aufbau des O-REGsfl aus D-FlipFlops (0501) er- 
sichtlich. Die UND-Gatter (0502) und das OR-Galier (0503) bilden uber den Inverter (0504) einen durch Mode gesteu- 
crtcn Multiplexer (0506), der entweder die Eingangsdatcn auf die D-FlipFlop (0501) schaltct, oder die Ausgangsdatcn 
der D-FlipFlop um ein Bit verse hoben an deren Eingang Ieitet. Das UND-Gatter (0505) ist nicht notwendig, da ein Ein- 
gang permanent auf logisch 0 liegt. Es dient nur der Anschaulichkeit. In Fig. 5c ist das Timingdiagramm in Abhangigkeit 

35 von dem Signal Mode angegeben. Der Takt wird von der SYNC-SM generiert. 

Fig. 6a zeigt den Blockaufbau des R-REGsft vor dem Register (0601) liegt ein Multiplexer (0602), der entweder die 
Eingangsdatcn auf das Register (0601) schahcl, oder die Ausgangsdatcn des Registers (0601) versehoben an dessen Ein- 
gang leitet. Der von der SYNC-SM generierte Takt wird um einen Halbtakt versehoben an das Register gefiihrt. In Fig. 
6b ist das Blockdiagramm auf Gattercbcne dargcstclll. Ubcr cincn Dckodcr (0603) schalten Modc0-2 cincn aus UND- 

40 Gattern mit nachgeschaltetem ODER-Galter bestehenden Multiplexer (0606). Dabei sind die gestrichelt eingezeichneten 
Gatter (0605 und weitere) nur der Verde utli chung wegen eingezeichnet. Sie sind funktionsios, da ein Eingang standig auf 
L liegi. Der Multiplexer schaltct im Zustand ModcQ-2 = 010 das Eingangssignal auf die Register (0607). In den Zustan- 
den Mode0-2 = 000 bis ModeO-2 = 001 werden die Ausgangswerte der Register (0607) nach links, in den Zustanden 
ModeO-2 = 01 1 bis ModeO-2 = 100 rechts, um ein bzw. zwei Bit versehoben, an die Eingange der Register gefiihrt. Die 

45 Scheibefunktion wird in Abhangigkeit vom Zustand ModeO-2 im Timingdiagramm Fig. 6c verdeutlicht. 

Fig. 7a zeigt den Aufbau des Multiplexers R20-MUX, der in Abhangigkeit von Mode die Operanden oder das Ergeb- 
nis an die EALU weiterleilel. Dabei ist Fig. 7a als herkommlicher Multiplexer aufgebaut, wahrend in Fig. 7b die platz- 
und leistungssparende Variante durch die Verwendung von CMOS Transfer-Gates (0701) aufgezeigt wird. Alle in dieser 
Schrift beschriebenen bcschricbcncn Multiplexer konnen mittels Transfer-Gates aufgebaut werden. 

50 Ein Tor kann aquivalent zum Multiplexer aus Transfer-Gates aufgebaut werden. Dabei ist jedoch die Richtung des Da- 
tenausiausches genau umgekehrt ! 

Fig. 8 zeigt das Verhaltnis des PAE-inlernen Taktes CLK zu den stattfindenden Aktivilaten. Bei der steigenden Flanke 
(0801 ) werden die Operanden in die O-REG gespeichert. Wahrend des H-Pegels (0802) verarbeitet die PAE die Daten (A 
PAE = Verarbcitungsphase). Das umfaBt den Datenverkehr zwischen den O-REG und dem R-REG. Bei der fallcndcn 

55 Flanke (0803) wird das Ergebnis im R-REG gespeichert. Der L-Pegel (0804) wird fur die Verteilung der im Bussystem, 
eingeschlossen der BM-UNIT genutzl (A Network = Busphase). Der zeilliche Ablauf der von der SYNC-SM generierten 
Signale (oRDY und oACK, rRDY und rACK) ist in das Zeitdiagramm eingetragen. 

Das Ablaufdiagramm der Sync-UNIT ist in Fig. 9 dargestellt. Die Zustandsmaschine kennt zwei feste Zustande DA- 
TEN (0901) und ERGEBNIS (0902). DATEN wird auf die steigende Flanke synchroniser!, ERGEBNIS auf die Fal- 

60 lende. Dabei wird jeweils der Zustand der Eingangsparameter ausgewertet und je nach Ergebnis in den Zweig ja 
(0903/0904) oder ncin (0905/0906) gesprungen. Sind in DATEN die Operanden nicht bereit, wird ncin angesprungen. In 
den nachsten Schritten wird keine Operation ausgefuhrt, bis die Maschine nach DATEN zuriickspringt und erneut aus- 
wertet. Stehen nun Operanden, angezeigt durch oRDY, bereit, werden die Operanden im O-REG (0907) gespeichert. Die 
Operanden werden verarbeitet (0908) und gleichzeitig wird ausgewertet (0909), ob es sich bei mehrzyklischcn Opcratio- 

65 nen (serielle Operationen, die mehr als einen Taktzyklus benotigen), um den letzte Zyklus handelt, oder ob eine einzy- 
klische Operation ablauft. In diesen Fallen werden die Operanden durch oACK quiuiert (0910). Mit der fallenden Flanke 
wird ERGEBNIS synchronisiert. Dabei wird uberpruftob das Flag "Ergebnis vorhanden" gesetzt ist (091 1). Dieses Flag 
wird immer gesetzt, wenn ein fertiges Ergebnis durch rRDY signalisiert wird (0912). 
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In zwei Fallen wird in den JA-Zweig (0904) gesprungen: 

- Es ist kein vorhergehendes Ergebnis vorhanden (Flag "Ergebnis vorhanden" unwahr). 

- Es ist ein vorhergehendes Ergebnis vorhanden (Flag "Ergebnis vorhanden" wahr) und dieses ist mil rACK quit- 
ticrt. Tn diescm Fall (und nur in dicseni Fall(!)) sctzt 0902 das Ergebnis zuruck (091 3). 5 

Ansonsien wird in den NEIN-Zweig (0906) gesprungen und keine Operaiion ausgefiihrt, bis die Zustandsmaschine 
nach ERGEBNIS (0902) zuriickkehrt. Im JA-Zweig (0904) wird das Ergebnis in das Ausgangsregister R-RECsft gespei- 
chert (0914). Danach wird ausgewertel ob es sich um den letzten Zyklus einer mehrzykJischen Operation handelt (0915) 
(vgl. 0909) oder ob eine einzyklische Operaiion ablaufl, wenn ja, wird das Vorhandensein des Ergebnisses durch rRDY 10 
signalisiert (0916). Die Zustandsmaschine spring! nach DATEN (0901) zuruck. Die Erkennung ob es sich um den letzten 
Zyklus ciner Operation - odcr um cine einzyklische Operation - handelt kann uber das Signal FINISH (0916) von dcr 
SM-UNTT abgefragt werden. Dieses ist aktiv, wenn der letzte - oder einzige - Zyklus stattfindet. Der SM-UNIT wird der 
Zustand der SYNC-UNIT uber RUN (0917) signalisiert. RUN ist im Falle, daB eine Operation stattfindet aktiv, andern- 
falls in aktiv. Der Mechanism us des STOP-Eintrages im F-PLUREG und des daraus gencricrlen ReConfig ist in Fig. 9 t5 
nicht dargestellt, da der Ablauf trivial ist und aus der Beschreibung der SYNC-UNIT hervorgeht. 

Fig. 10 zeigt den prinzipiellen Aufbau der Power-UNrr Das Signal Sleep wird von F-PLUREG auf einen Transistor 
oder eine Transistors! ufe (1001) geleilel. Diese steuerl die Spannungsversorgung fur alle abschaltbaren Zellfunklionen. 
Die Sync-UNIT liefert das OneShotPowerSave-Signal (vgl. Fig. 16), uber welches die Spannungsversorgung der restli- 
chen Zellfunktionen durch einen Transistor odcr cine Transistorstufc (1002) freigegeben wird. Abhangig von den tat- 20 
sachlich verwendeten Funktionen in der Zelle, schalten die Transitoren oder Transistorstufen (1003) die nicht benotigten 
Funkt.ionen ab (PowerDown). Verstandlich ist, daB fur ordentliche Spannungsversorgung und KM V-Verhalten weitere 
entsprechende Vorkehrungen, wie Kondensatoren etc., getroffen werden mussen. 

Fig. 1 1 zeigt die Implementierung der Maschine aus Fig. 9 in das Konzept. Uber die BM-UNIT (1101) werden die Si- 
gnale oRDY(l/2) und rACK (vereinfacht dargestellt: latsachlich existiert rACKh und rACKl, rACK = rACKl & rACKh) 25 
zu den CCLK-gesteuerten Latches (1102) geschaltet. Dabei sind die Latch so geschaltet, daB sie in der L-Phase (Bus- 
phase) von CCLK transparent sind und in dcr H-Phase (Verarbcitungsphase) den Zustand haltcn. Die Ausgange dcr 
Latch slellen die Signale fur die Sync-StateMachine (1103) zur Verfugung. rRDY (vereinfacht dargestellt: tatsachlich 
existiert rRDYh und rRDYl, diese sind voUkommen gleich, werden jedoch an verschiedene Empfanger geleitet) von 

(1103) wird uber Tor auf den Bus geschaltet. Die Signale oACK(l/2) von (1103) werden in der BM-UNIT (1101) negiert 30 
und an die wiederum invertierenden Open-Kollektor-Bustreiber (1104) ge liefert. Der Bus wird uber Widerstande (1105) 

auf H gczogen. Die BNI-UNTT ist dabci geschaltet, daB folgcndc Fallc cintretcn: 

1. Wird der entsprechende Bus von der BM-UNIT nicht angesteuert, liegt an der Basis der Transistoren (1104) L 

an. Dadurch belasten sie den Bus nicht. 35 

2. Wird der entsprechende Bus von der BM-UNIT angesteuert, und das Signal nicht quittiert, liegt an der Basis der 
Transistoren (1104) H an. Das bedculel, daB der Bus auf L gezogen wird. Wird ein Ergebnis per Broadcasting an 
mehrere Datenempfanger verteilt, so Ziehen alle PAEs, die die Ergebnisdaten noch nicht quittiert haben und Warte- 
Zyklcn benotigen den Bus auf L. 

3. Wird der entsprechende Bus von der BM-UNIT angesteuert, und das Signal quittiert, liegt an der Basis der Iran- 40 
sistoren (1104) L an. Das bedeutet, daB der Bus nicht belastet wird. Wird ein Ergebnis per Broadcasting an mehrere 
Datenempfanger verteilt, so belasten alle PAEs, die die Ergebnisdaten quittiert haben und keinc Warte-Zyklen be- 
notigen den Bus nicht. 

Da der Bus in seinem Grundzustand den H-Pegel, also die Quittierung einnimmt ubersteuert die Nichtquittierung ge- 45 
maB Fall 2 die Quittierung, in dem sie den Bus auf L zieht. Dabei geht der Bus erst dann in den H-Pegel, also in den Quil- 
tierungszusland, wenn alle PAEs quiltieren. Es ist sonrit eine Wired- AND-Schaltung realisiert. Die Sync-StateMachine 
stellt das Signal RUN (1107) der SM-UNIT (1106) zur Verfugung. Diese lauft aufgrund von RUN an. Befindet sich die 
SM-UNTT im letzten - odcr cinzigen - ZYklus ciner Vcrarbeitung, so signalisiert sic dies uber FINISH (1108) an die 
Sync-StateMachine. FINISH wird in den Auswerteeinheiten zur Erkennung des letzten Zyklus (0907, 0915) ausgewertet. 50 
Die SM-UNIT lauft synch ron zum PAK-intemen Takt CLK, 

Fig. 12 zeigt den Aufbau der BM-UNIT Abhangig von den Eintragen in das M-PLUREG schalten die Multiplexer 
(1201,1202) die Operanden vom internen Bus (1203) zu den O-REG. Ebenfalls schalten die Tore (1204, 1205) die untere 
und obere Halftc des Ergebnisses auf den Bus. Der Multiplexer 1206 schaltet die oRDY(l/2) gemaB der Stellung von 
1201 und 1202 und rACK gemaB der Stellung von 1204 und 1205 vom Bus in die PAE. Dabei werden die rACK beider 55 
Datenempfanger miteinander verUNDet. Existiert nur ein Datenempfanger, so ist der Multiplexer so geschaltet, daB er 
statt des fehlenden rACK eine logische 1 zurtickgibt. 1207 beinhaltet ein Gate zum Aufschalten der Signale oACK(l/2) 
und rRDY auf den Bus. Dabei werden die Signale oACK(l/2) zunachst invertiert und dann uber Open-Kollektor-Treiber 

(1104) auf den Bus geschaltet. 

Fig. 13 verdeutbcht den Aufbau eines O-MUX. Dabei existiert ein 3:5 Dekoder (1301) zum Auswerten der 60 
Mode2. .0 Signale aus dem M-PLUREG. Dcr Multiplexer ist uber UND-Gattcr (1302) mit nachgeschaltetem ODER- 
Gatter (1303) aufgebaut. Das Auswertesignal von Mode2 ... 0 - 000 des Dekoders (1301) ist dabei direkt auf die 
ODER-Gatter geschaltet (1304). Das bewirkt, daB in offenem Zustand, d. h. keine Verbindung zu einem Bussystem, im- 
mer logisch 1 zuruckgelicfert wird. (Vgl. mit Fig. 12 rACK). Zur Vereinfachung ist nur eine rcduzicrte BusgroBc darge- 
stellt. 65 

In Fig. 14 ist. der Aufbau eines R-GA'iTi dargestellt. Dabei existiert ein 3 : 4 Dekoder (1401) zum Auswerten der 
Mode2 ... 0 Signale aus dem M-PLUREG. Das Auswertesignal von Mode2 . . . 0 - 000 des Dekoders wird nicht ver- 
wendet. Dadurch wird keine Busverbindung bei dieser Bit-Kombination hergestellt. Die Gates (1402) sind entweder 
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durch UND-Gatter oder Transmisson-Gaies (vgl. 0701) aufgebaut. Dabei ist eine Verstarkersiufe zum Treiben der Bus- 
last vor- oder nachgeschahei. Zur Vereinfachung isi nur eine reduzierie BusgroBe dargestellt. 

Die SlateBaek-UNIT ist in Fig. 1 5 dargesteLlt. GemaB der Einslellung im M-PLUREG schallel ein Multiplexer (1501) 
entwederdie Signale CarryOut-AlessB, AequalB-Odetect von derEALU oder die Ausgange des R-REG R-REGD2 . . . 0 
5 durch. Die Signale gelangcn an cine Opcn-Kollcktor-Transistor-Stufc (1502) und werden auf den PLU-Bus gcschaltci. 
Dabei benotigt der PLU-Bus exteme, nahe der PLU positionierte Pull-Up- Widerstande (1503). Das Latch 1504 ist optio- 
nal. Wird es in die Ausgangssignale von 1501 eingeschleift, werden diese erst auf den Bus (1503) geschaltel, nachdem 
der Daienempfanger die Daten iiber rACK quittiert hat. Dadurch wird bewirkl daB die Bereitschaft zur Umkonfigurie- 
rung iiber die Stalussignale erst angezeigt wird, wenn die Daten auch angenommen wurden. Norma lenveise wird dies 
10 durch das Zusammenspiel von STOP und ReConfig in der Sync- UNIT geregell; daher ist das Latch optional. Das rACK 
wird dabei als Latch-Takt verwendet. Dabei ist das Latch bei rACK = 1 transparent und speichert bei rACK = 0. 

Fig. 16 vcrdcutlicht die Funktionswcisc dcsOneShot-MODH. Ubcrcincn Multiplexer (1601) schalten die Signale 

- Vcc 

15 - oRDYl 

- oRDY2 

- (oRDYl & rACK) 

abhangig von der Einstellung im F-PLUREG den Zell-Takt frei. Dabei bewirkt die Freischaltung iiber Vcc, daB der Takt 
20 immer lauft (siche Timing-Diagramm "Normalcr Bctricb"). In den 3 ubrigen Modi lauft der Takt erst an, wenn die Si- 
gnale, oder Signalkombinationen den Takt freigeben. Die Freigabe wird durch ein Latch (1602) auf den Takt CCLK syn- 
chronisiert, damit. die Phase nicht vorzeitig abbricht, wenn das Freigabesignal zu kurz ist. Dabei ist das Latch in der L- 
Phase von CCLK transparent und halt den Wert in der IT-Phase. Das Freigabesignal gelangt auf das UND-Gatter- Paar 
(1603 und 1604), das den Takt freigibt. Liber einen Inverter (1605) wird das invertierte Taktsignal !CLK erzeugt, CLK 
25 lauft urn die Phasengleichheii zu gewahrleisten durch ein Verzogerungsglied (1 606) (siehe Tinung-Diagramin "One-Shot 
Betrieb"). Dabei wird CCLK in der Zuleitung zu 1604 iiber zwei Verzogerungszeitungen (1610) verzogert urn Phasen- 
gleichheii zum an 1603 anliegcndcn CCLK, das durch den Multiplexer (1608) verzogert wurde, zu gewahrleisten. Wird 
eine PAE in den PowerSave-Mode gebracht, wird die Versorgungsspannung der Zelle weitgehend ausgeschaltet. Dies 
geschiehl iiber das ODER-Gatter 1611. Ist der PowerSave-MODE eingeschaltet, d. h. PowerSave = 1, fiihrt das negierte 
30 Signal L. Ist zuclem der OneShot-MODE eingeschaltet und das Register 1602 auf L, wird iiber das OneShotPowerSave- 
Signal der Spannungsversorgungstransistor in der Power-UNIT (vgl. Fig. 17) abgeschaltet. Steht das Register 1602 je- 
doch auf logisch 1 (oder PowerSave = 0), wird der Spannungsversorgungstransistor iiber 1611 eingeschaltet. Die fol- 
gende Tabelle gibt einen Uberblick iiber die Funktion: 



PowerSave 


Latch (1602) 


Spannung 


Beraerkung 


L 


X 


an 




H 


L 


aus 


nur wenn OneShot- 
MODE gesetztl 


H 


H 


an 





Beim Einschalten der Versorgungsspannung entsteht eine zcillich bestimnitc Aufwachzeit, bis die Zelle arbeilsfahig 
ist. Um dennoch ordentlich zu funktionieren, miissen die Signale entsprechend verzogert werden. Hierzu wird CCLK 
iiber eine Verzogerungsleit ung (1607) geleitet. Kin Multiplexer (1608) wahlt entsprechend dem Signal PowerSave aus F- 
45 PLUREG aus, ob der normale oder verzogerte Takt an die Zelle geleitet wird. Verzogert wird nur der nicht invertierte 
Takt um den Zeitraum APowerOn, der invertierte Takt wird nicht verzogert. Dadurch steht das Ergebnis synchron zu den 
restlichen Bausteinfunktionen zur Verfugung. Dadurch verringert sich die nulzbare Verarbeitungszeil auf Aprocess. Die 
maximale Taktfrequenz des Bausteines hangt somit von Z = APowerOn + Aprocess ab (siehe Timing-Diagramm "OneS- 
hot Bctricb mit PowerSave"). 

50 

5. Begriffsdefinition 

AequalB-Odetect: Durch die EALU generiertes Signal, das bei arithmetischen Operationen anzeigt, daB das Ergebnis 
gleich null ist. Bei Vcrglcichen wird angezeigt, daB Operand A gleich Operand B ist. 
55 ALU: Arithmetisch logische Einheit. Grundeinheit zum Verarbeiten von Daten. Die Einheit kann arithmetische Ope- 
rationen wie Addition, Subtraktion, unter Umstanden auch Multiplikation, Division, Reihenentwicklungen usw. durch- 
fiihren. Dabei kann die Einheit als ganzzahlige (integer) Einheit oder als FlieBkomma-(floating-point)-Einheit gestaltet 
sein. Ebenfalls kann die Einheit logische Operationen, wie UND, ODER, sowie Vergleiche durchfuhren. 

BM-UNTT: Einheit zum Aufschalten der Daten auf die Bussysteme auBerhalb der PAE. Das Aufschalten geschiehl 
60 iiber Multiplexer fur die Dateneingange und Tore fur die Datenausgange. oACK-Leitungen sind als Open-Kollektor- 
Trcibcr implcmentiert. Die BM-UNTT wird durch das M-PLUREG gestcuert. 

Broadcast: Senden von Daten einer PAE an mehrere Daienempfanger. 

CarryOut-AlessB: Durch die EALU generiertes Signal, das bei arithmetischen Operationen einen Ubertrag anzeigt. 
Bei Vergleichen wird angezeigt, daB Operand A klciner als Operand B ist. 
65 Datenempfanger: Die Einheit(en), die Ergebnisse der PAE weiterverarbeitetAarbeiten. 

Datensender: Die Einheit(en), die Daten fur die PAE als Operanden zur Verfugung stellt/stellen. 

D-FlipFlop: Speicherelement, welches ein Signal bei der steigenden Flanke eines Taktes speichert. 

EALU: Erweiterte arithmeusch logische Einheit. ALU, die um Sonderfunktionen, die zum Betrieb einer Daten verar- 
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beitungseinrichtung gemaBDE441 16 881 Al benotigt werden odersinnvoll sind crweilert wurde. Dies sind ins beson- 
dere Zahler. 

FPGA: Programmierbarer Logikbauslein. Sland derTechnik. 

F-PLUREG: Register in dem die Funktion der PAE geseizt wird. Ebenfalls wird der OneShot- und Sleep-Mode ge- 
setzt. Das Register wird von der PLU beschricben. 5 

Gatter: Gruppe von Transistoren. die eine logische Grundfunktion durchfiihren. Grundfunktionen sind z. B. NAND, 
NOR, Transmission-Gates. 

II-Pegel: Logisch 1 Pegel, abhangig von der verwendeten Technologic 

Handshake: Signalprotokoll, bei dem ein Signal A einen Zustand anzeigt und ein anderes Signal B bestatigt, daB es Si- 
gnal A akzepiiert und darauf, reagieri (hat). 10 

Konfigurieren: Bestimmen der Funktion und Vernetzung einer logischen Einheit, einer (FPGA)-Zelle oder einer PAE 
(vgl. umkonfigurieren). 

Latch: Speicherelement, das ein Signal fur gewohnlich wahrend des H-Pegels transparent weiterleitel und wahrend 
des L-Pegels speichert. In PAEs werden teilweise Latches gebraucht, bei denen die Funktion der Pegel genau umgekehrt 
isl. Hicrbei wird vor den Takt eines ublichen Latch cin Inverter geschallet. 15 

L-Pegel: Logisch 0 Pegel, abhangig von der verwendeten Technologic 

M-PLURHG: Register in dem die Vernetzung der PAE gesetzt wird. Das Register wird von der PLU beschrieben. 
Next-Neighbour Vernetzung: Vernetzung der Bussysleme mit den an den Kanlen ansloBenden Nachbarn. 
O-MIJX: Multiplexer innerhalb der BM-UN1T, der das Bussystem der Operanden auswahlt. 

OneShot: Modus in dem cine PAE mit cincm gcringcrcn als dem Prozessortakt arbcitct. Der Takt ist synchron zum 20 
Prozessortakt und entspricht einer Peri ode. Eine Phasenverschiebung existiert nicht. Der Takt wird iiber eines derSignale 
oRDY(l/2) oder rRDY freigegeben. Dieser Modus dient der Stromeinsparung, wenn die Datensender oder -empfanger 
langsamer als der Prozessortakt Daten senden oder empfangen. 

Open-Kollektor: Schaltungstechnik, bei der der Kollektor eines Transistors an einem, iiber einen Pullup auf den H-Pe- 
gel gezogenen, Bussignal liegt. Der Emitter der Transistors liegl auf Masse. Schaltel der Transistor, so wird das Bussi- 25 
gnal auf den L- Pegel gezogen. Vorteil des Verfahrens ist, daB eine Mehrzahl solcher Transistoren den Bus ohne elektri- 
schc Kollision stcuern konncn. Dabei sind die Signale ODER-vcrkiipft, es entsteht das sog. wircd-OR. 

O-REG: Operandenregister zur Speicherung der Operanden der EALU. Ermoglicht die zeitliche und funktionelle Un- 
abhangigkeit der PAE von den Datensendem. Dadurch wird der Transfer der Daten ,vereinfacht, da er asynchron oder pa- 
ketorientiert slatifinden kann. Gleichzeitig wird die Moglichkeit geschaflen die Datensender unabhangig von der PAE 30 
oder die PAE unabhangig von den Datensendem umzukonfigurieren. 

O-REGsft: O-REG mit durch SM-UNTT gesteucrtem Schiebe register. 

PA: Processing Array: Array aus PAEs. 

PAE: Processing Array Element: EALU mit O-REG, R-REG, R20-MTJX, F-PLIJRECi, M-PLUREG, BM-, SM-, 
Sync-, StateBack- und Power-UNIT. 35 

PLU: Einheit zum Konfigurieren und Umkonfigurieren der PAE. Ausgestaltet durch einen speziell an seine Aufgabe 
angepaBlcn Mikrokontroller. 

PowerSave-MODE: Stromsparmodus Modus innerhalb des OneShot-MODE. Wahrend keine Operation ausgefuhrt 
wird werden allc Tcilc der PAH mit Ausnahmc des M-PLURHG und Sync-UNIT nicht mit Spannung vcrsorgt. 

Power-UNIT: Einheit die die Stromsparfunktionen regelt. 40 
PutlDown: Widerstand, der eine Busleitung auf einen L- Pegel zieht. 
PullUp: Widerstand, der eine Busleitung auf einen H-Pcgel zieht. 

R-GATE: Schalter innerhalb der BM-UNTT, der das Ergebnis auf das entsprechende Bussystem aufschaltet. Dabei 
sind einige Signal iiber als Open-Kollektor-Treiber aufgeschaltet Das R-GATE arbeitet als Bustreiher und kann in einen 
busneutralen Modus gehen. 45 

R20-MUX: Multiplexer zum Einschleifen des Ergebnisses in einem R-REG-sft in den Datenpfad zwischen O-REG 
und EALU. 

R-REGsft: Ergebnisregister zur Speicherung des Ergebnis der EALU. Ermoglicht die zeitliche und funktionelle Un- 
abhangigkeit der PAE von den Datencmpfangern. Dadurch wird der Transfer der Daten vereinfacht, da cr asynchron oder 
paketorientiert stattflnden kann. Gleichzeitig wird die Moglichkeit geschaffen die Datenempfanger unabhangig von der 50 
PAE oder die PAE unabhangig von den Datenempfangern umzukonfigurieren. Das Register ist mit einer Schieb funktion 
versehen, die von def i>M-UNIT gesteuert wird. 

serielle Operationen: Operationen, die durch serielles Abarbeiten eines Daten wortes oder eines Algorithmus durchge- 
fiihrt werden. Serielle Multiplikation, serielle Division, Reihencntwicklung 

Sleep- MODE: Stromsparmodus in dem die PAE mit Ausnahme von F-PLUREG ohne Spannung ist. 55 
SM-UMT: StateMachine-UNIT. Zustandsmaschine, die die EALU steuert. 

StateBack-UNTT: Einheit, die die Riickmeldung der Statussignale an die PLU steuert. Bestehend aus einem Multiple- 
xer und einer Open-Kollektor-Bustreiberstufe 

Sync-UNIT: Einheit, die die Synchronisation der PAE mil den Datensendem und -empfangern uberniimnt, sowie das 
Umkonfigurieren von PAEs uberwacht. Gleichzeitig werden die OneShot-Funktionen ubernommen. 60 

Tor: Schalter, der cin Signal wciterlcitet oder sperrt. Einfachcr Verglcich: Relais 
Umkonfigurieren: Neues Konfigurieren von einer beliebigen Menge von PAEs wahrend eine beliebige Restmenge von 
PAEs ihre eigenen Funktionen fortsetzen (vgl. konfigurieren). 

Zustandsmaschine: Logik, die diverscn Zustanden annchinen kann. Die Ubergange zwischen den Zustanden sind von 
verschiedenen Eingangsparametern abhangig. Diese Maschinen werden zur Steuerung komplexer Funktionen eingesetzt 65 
und entsprechen dem Stand derTechnik. 
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6. Konventionen 
6.1 Nainenskonveniion 

5 Baugruppc: -UNIT 

Beiriebsan: -MODE 

Multiplexer: -MUX 

Negiertes Signal: not- 

Register fur PLU sichtbar: -PLUREG 
10 Register intern: -REG 

Schieberegisters: -sft 

6.2 Funktionskonvention 

15 Schiebercgisler: sft 
UND-Funktion: & 
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50 

Pat en tan spriiche 

1 . Konfigurierbare und zur Laufzeit umkonfigurierbare Einheit zur Verarbeitung von numerischen und logischen 
Operation en (PAE), zum Einsatz in Prozessoren (CPUs), Mehrrechnersystemcn, DatenfluBprozessoren (DFPs), Di- 
55 gitalen Signal Prozessoren (DSPs), systolischen Prozessoren und programmierbaren Logikbausteinen (FPGAs), ge- 

steuert von einer Ladelogik (PLU), dadurch gekennzeichnct, daB 

1. eine programmierbare Recheneinheit (EALU) zur Durchfuhrung der mathematischen und logischen 
Grundfunktionen besteht, 

2. die Funktion und Vernelzung der Recheneinheit in Register programmierl wird und eine Vielzahl von Da- 
60 ten, ohne Umprogrammierung der PAE, verarbeitet werden kann, 

3. zur Steuerung der Recheneinheit (EALU) cine Zustandsmaschine (SM-UNTT) exist iert, 

4. Register fur jeden Operanden (O-REG) und das Ergebnis (R-REG) bestehen, wobei die Register teilweise 
als Scheiberegister ausgefiihrt werden konnen, 

5. eine Ruckkopplung der Daten des Ergebnisregisters auf einen Eingang der EALU uber einen Multiplexer 
65 (R20-MUX) besteht, 

6. eine Buseinheit (BM-UNTT) den AbgrifT der Daten von einern Bussystem ermoglicht bzw. das Einspeisen 
des Ergebnisses auf ein Bussystem, wobei die Buseinheit Daten an mehrere Empfanger versenden kann und 
die Synchronisierung auch mehrerer Empfanger automatisch erfolgt, 



12 



DE 196 51 075 A 1 

7. cier BuszugrifY von der Daienverarbeitung in der EALU iiber die Regisier entkoppeli ist und somil jede PAE 
als unabhangige Einheit betrachtet werden kann, ins besondere die Kontiguralion und Umkonfiguration eine 
PAE keinen storenden EinfluB auf die Datensender und -einpfanger, sowie die unabhangigen PAEs hat, 

8. der Ablauf der Busiransfers iiber eine Zustandsmaschine (SYNC-UNIT) automatisch gesteuen wird und 
dafur die Handshakc-Leiiungcn oRDY, oACK, rRDY und rACK zur Vcrfugung slchcn, 5 

9. Riickjneldungen an die PLU zur Erkennung des Zustandes der Verarbeilung und der Umkonfigurierbarkeit 
der PAE erfolgen (StateBack-UNIT). 

2. Einheil nach Anspruch 1, dadurch gekennzeichnet, da8 die Daienverarbeitung einer PAE angehalien werden 
kann (Eintrag STOP in F-PLUREG) und die PAE daraufhin nach VoLiendung der gerade laufenden Daienverarbei- 
tung ihre Bereilschafl zur Umkonfiguration anzeigl (ReConfig). 10 

3. Einheil nach Anspruch 1, dadurch gekennzeichnet, dafi Stromsparmodi existieren, 

- in wclchen die PAE immcr nur dann arbeilct, wenn Operandcn vom Datensender am Hingang bcrciLsichcn 
und das Ergebnis bereits vom Empfanger angenommen wurde, und die PAE ansonsten ohne Takt statisch 
bteibt, 

- in welchen Tcilbercichc der PAE, die zur Ausfuhrung der momentancn Daienverarbeitung irrelevant sind, t5 
von der Takt- und/oder Stromversorgung geLrennt sind, 

- in welchen die PAE von der Spannungsversorgung getrennt ist. 
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